import pandas as pd
import matplotlib.pyplot as plt


# 为了图能够正常显示中文，设置字体为SimHei
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

# 读取a2.xlsx文件，获取数据，显示前几行以了解数据结构，然后将行业代码列的第一个字符提取出来作为行业大类
data = pd.read_excel('a2.xlsx')
data.head()

# 分组并计算行业大类分布
data['行业大类'] = data['行业代码'].str[0]
industry_distribution = data['行业大类'].value_counts()
print(industry_distribution)

# 使用Matplotlib绘制饼图
plt.figure(figsize=(10, 8))
industry_distribution.plot.pie(autopct='%1.1f%%', startangle=140, labels=None)
plt.title('各行业大类的分布情况')
plt.ylabel('')  # Hide y-label as it is not necessary for pie charts
plt.legend(industry_distribution.index, title='行业大类', bbox_to_anchor=(1, 0.8))
plt.show()













